智能论文笔记

BERT-based Ensemble Approaches for Hate Speech Detection

Khouloud Mnassri , Praboda Rajapaksha , Reza Farahbakhsh , Noel Crespi

分类：自然语言处理 | 机器学习

2022-09-14

随着在线社交媒体提供的沟通自由，仇恨言论越来越多地产生。这导致网络冲突影响个人和国家一级的社会生活。结果，在发送到社交网络之前，仇恨的内容分类越来越需要过滤仇恨内容。本文着重于使用多个深层模型在社交媒体中对仇恨言论进行分类，这些模型通过整合了最近的基于变压器的语言模型，例如BERT和神经网络。为了改善分类性能，我们通过几种合奏技术进行了评估，包括软投票，最大价值，硬投票和堆叠。我们使用了三个公开可用的Twitter数据集（Davidson，Hateval2019，OLID）来识别进攻性语言。我们融合了所有这些数据集以生成单个数据集（DHO数据集），该数据集在不同的标签上更加平衡，以执行多标签分类。我们的实验已在Davidson数据集和Dho Corpora上举行。后来给出了最佳的总体结果，尤其是F1宏观分数，即使它需要更多的资源（时间执行和内存）。实验显示了良好的结果，尤其是整体模型，其中堆叠在Davidson数据集上的F1得分为97％，并且在DHO数据集上汇总合奏的77％。

translated by 谷歌翻译

与单变量预测方法相比，在一组多个时间序列中培训的全球预测模型（GFM）在许多预测竞赛和现实世界应用方面表现出优越的结果。 ETS和Arima等统计预测模型的普及的一个方面是它们相对简单和可解释性（就相关的滞后，趋势，季节性等），而GFM通常缺乏可解释性，特别是对特定时间序列。这减少了基于预测的决策时对利益相关者的信任和信心，而不是能够理解预测。为了减轻这个问题，在这项工作中，我们提出了一种新颖的本地模型 - 不可知论解释方法来解释GFM的预测。我们培训更简单的单变量代理模型，这些模型被认为是通过自动启动或直截了当地作为时间序列的一步的全局黑匣子模型预测所获得的邻域内的邻域内的样本的可解释（例如，ETS）。需要解释哪些。之后，我们评估了对全球模型在定性和定量方面的预测的解释，例如准确性，保真度，稳定性和可理性，并且能够展示我们方法的好处。

translated by 谷歌翻译